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摘 要 全 信息 项 目 双 
用 。 首 先 详 细 介绍 了 全 信息 项 目 双 
想 ， 然 后 例 举 全 信息 项 目 双 
目 双 
因而 具有 广 


阔 的 应 用 前 景 。 


因子 分 析 作 为 一 种 重要 的 统计 方法 ,使 得 双 因 子 模型 在 近 20 年 得 到 重新 认识 和 广泛 应 
因子 分 析 方 法 的 概念 、 特 征 、 模 型 基础 以 及 参数 估计 中 体现 的 维度 缩减 思 
因子 分 析 在 分 析 测验 结构 、 分 数 解释 和 计算 机 化 自 适应 测验 中 的 应 用 。 全 信息 项 
因子 分 析 中 双 因 子 模 型 符合 大 量 心理 、 教 育 与 医学 测验 的 结构 特征 ， 其 维度 缩减 方法 能 显著 降低 计算 量 ， 
结合 当前 研究 现状 对 全 信息 项 目 双 因子 分 析 的 相关 研究 ， 如 : 参数 估计 、 模 型 特 


征 、 拟 合 检验 、 量 表 连 接 、 项 目 功 能 差异 及 其 在 计算 机 化 自 适 应 测验 中 的 应 用 提出 一 些 思考 和 建议 。 


关键 词 ” 双 因子 模型 ; 全 信息 项 目 双 因子 分 析 ; 双 
分 类 号 B841 


1 引言 


随 着 心理 测量 理论 和 技术 的 发 展 ， 科 学 研究 
与 实践 工作 已 越 来 越 离 不 开 各 类 测验 ( 量 表 ) 了 。 测 
验 ( 量 表 ) 的 结构 作为 解释 测验 分 数 的 基础 ， 一 直 
是 测验 ( 量 表 ) 开 发 的 重要 内 容 之 一 。 事 实 上 ,大 部 
分 测验 都 是 为 了 测量 单一 特质 而 从 多 个 相互 关联 
的 维度 或 层面 进行 抽样 来 设计 项 目 。 例 如 ,在 建 
构 生 活 质量 量 表 时 ， 研 究 者 一 般 会 从 工作 满意 、 
家 庭 经 济 状 况 、 健 康 和 社会 生活 等 多 个 方面 来 抽 
样 和 设计 项 目 。 这 种 两 阶段 抽样 程序 ,往往 导致 
领域 内 部 相关 高 于 领域 之 间 的 相关 , 项 目 反 应 在 
测验 考察 的 主要 维度 上 不 满足 条 件 独 立 性 ， 从 而 
使 测验 结构 变 得 更 加 复杂 。 一 般 地 , 测验 或 量 表 
的 测量 结构 可 以 划分 为 以 下 五 类 : 单 维 模型 


[Es 


因子 项 目 反 应 理论 模型 ; 维度 缩减 


order factor model) 和 双 因 子 模型 (bifactor model). 

Hep, 单 维 模 型 ( 见 图 1(a)) 的 限制 条 件 最 严 
格 ， 它 要 求 所 有 项 目测 量 同一 个 特质 ， 该 特质 解 
释 所 有 项 目 反应 的 协 方差 。 图 1b) 和 (c) 所 示 的 两 
类 项 目 间 多 维 模 型 [between-item multidimensional 
model) 要 求 每 个 项 目 只 在 一 个 因子 上 有 负载 。 它 
们 虽然 包含 多 个 因子 , 但 是 可 形成 多 个 子 量 表 ， 
可 用 单 维 项 目 反 应 理论 (Item Response Theory, 
IRT) 模 型 去 拟 合 各 个 子 量 表 。 图 1(b) 假 设 因 子 之 
间 相 互 独 立 , 结构 简单 ， 又 称 为 多 个 单 维 IRT 模 
型 。 但 是 它 很 少 用 于 检测 实证 数据 的 潜 特 质 结 
Fal, 而 图 1(c) 允 许 因子 相关 ， 能 同时 估计 多 个 潜在 
特质 , 与 多 个 单 维 模型 相 比 提高 了 测验 效率 。 但 
相关 特质 模型 通常 存在 高 阶 特质 , 混淆 了 一 阶 因 


(unidimensional model). 、 多 个 单 维 模型 multi- 
unidimensional model), 相关 特质 多 维 模型 (correlated 
traits multidimensional model)、 二 阶 因 子 模型 (second- 
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子 和 高 阶 因子 ， 当 测验 (项 目 ) 拟 合 检验 很 差 时 ， 
不 能 指出 因子 结构 的 错误 (Reise, 2012)。 图 1 (d) 
所 示 的 二 阶 因子 模型 包括 6 个 观察 变量 、 两 个 一 
阶 因子 和 一 个 二 阶 因 子 。 如 图 所 示 ， 二 阶 因子 与 
观察 变量 不 直接 相关 ， 它 对 观察 变量 的 效应 通过 
一 阶 因子 的 中 介 起 作用 ， 其 效应 量 与 一 阶 因 子 在 
二 阶 因子 上 的 负载 成 比例 (Seo & Weiss, 2015). 二 
阶 因子 反映 一 阶 因子 之 间 的 相关 ,根据 二 阶 因子 
在 一 阶 因子 上 的 负载 可 以 反映 其 能 够 解释 一 阶 因 
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子 的 程度 。 因 而 ,二 阶 因 子 在 概念 上 是 一 个 抽象 
结构 ， 根 据 研究 者 对 一 阶 因子 的 理解 从 而 对 二 阶 
因子 的 解释 可 能 不 同 。 图 1 (e) 所 示 的 双 因子 模型 
中 ,一般 因 子 (general factor，G) 和 特定 领域 因子 
或 称 为 组 因子 (specific domain factor or group 
factor，S) 与 观察 变量 直接 相关 ， 相互 独立 地 解释 
观察 变量 的 变异 。 其 中 ,一 般 因 子 解释 所 有 项 目 
间 的 相关 ， 多 个 “组 因子 ”独立 于 一 般 因 子 ， 解 
释 项 目 组 中 去 掉 被 一 般 因子 所 解释 的 那 部 分 变异 
外 的 共同 变异 。 组 因子 可 能 代表 子 量 表 或 项 目 组 
测量 的 特殊 特质 ， 也 可 能 是 无 关 因子 (例如 项 目 在 
表达 上 存在 正 相关 或 负 相 关 ， 或 者 观察 变量 受到 
共同 提示 的 影响 )。 

除了 图 1 所 示 的 差异 外 ,， 这 几 个 测量 模型 同 
时 还 具有 密切 联系 。 双 因子 模型 中 当 一 般 因 子 的 
负载 显著 大 于 组 因子 的 负载 时 , 一 般 因子 可 以 解 
释 为 本 质 上 是 单 维 模型 所 测量 的 潜在 特质 。Yung， 
Thissen 和 McLeod (1999) 运 用 推广 的 Schmid- 
leiman 转换 方法 (Schmid & Leiman, 1957), 证 明 
在 不 满足 有 关 比 例 的 约束 条 件 时 二 阶 因子 模型 洪 


使 用 相关 特质 MIRT 模型 ， 当 维度 间 存 在 中 、 高 
等 相关 时 (相关 系数 在 0.4 WE), 建议 采用 双 因 子 
模型 (Reise, Morizot, & Hays, 2007)。 

与 二 阶 因 子 模型 、 相 关 特 质 模型 和 单 维 模型 
相 比 ， 双 因子 模型 具有 很 多 优势 。 首先 ， 双 因子 模 
型 很 容易 解释 一 般 因子 对 项 目的 影响 , 通过 检验 
一 般 因子 与 组 因子 对 项 目的 直接 影响 ,可 以 比较 
不 同 因子 的 重要 性 (Canivez, 2016)。 然 而 ， 二 阶 因 
子 模型 中 高 阶 因子 代表 一 阶 因子 的 变异 ,不 能 
接 检 验 高 阶 因 子 和 项 目 之 间 关 系 的 强度 。 其 次 ， 
双 因 子 模型 中 还 可 以 检验 去 掉 一 般 因子 的 影响 之 
后 , 组 因子 的 测量 结构 在 两 个 或 多 个 被 试 组 之 间 
是 否 等 价 。 特 别 地 ， 当 给 定 足 够 水 平 的 测量 不 变 
性 时 , 它 能 比较 不 同 被 试 组 在 一 般 因 子 和 组 因子 
上 的 差异 。 然 而 ,二 阶 因子 模型 中 只 能 检验 二 阶 
因子 的 测量 不 变性 和 比较 不 同 被 试 组 在 二 阶 因子 
上 的 差异 , 再 次 , 与 多 个 单 维 模型 相 比 ， 双 因子 模 
型 可 以 提供 更 准确 的 项 目 参 数 、 特 质 估计 和 测验 
信 度 (DeMars, 2006)。 此 外 ， 双 因子 模型 还 可 以 检 
验 单 维 模型 在 拟 合 多 维 数据 时 的 失真 情况 。 


套 于 双 因 子 模型 ， 当 加 上 关于 比例 的 约束 条 件 时 
双 因 子 模型 和 二 阶 因 子 模型 等 价 。 这 里 比例 的 约 
束 条 件 包括 (1) 双 因子 模型 中 一 般 因子 在 项 目 上 的 
负载 等 于 二 阶 因 子 模型 中 二 阶 因子 在 对 应 一 阶 因 
子 的 负载 与 该 一 阶 因子 在 项 目 上 负载 的 乘积 ， 和 
(2) 双 因子 模型 中 , 一般 因子 和 对 应 组 因子 在 每 个 
项 目 上 的 负载 的 比例 相等 (Chen,，West, & Sousa, 
2006)。 一般 地 ， 当 维度 之 间 不 相关 或 相关 较 弱 ( 相 
关系 数 在 0.1 以 下 )， 建 议 采 用 多 个 单 维 模型 ; 当 
维度 之 间 存 在 中 、 低 等 相关 时 (相关 介 于 0.1 到 0.4), 
项 目 在 一 般 因子 的 负载 小 于 组 因子 的 负载 ， 建 议 


(a) 单 维 模型 


RP 
AGRE TD 


(d) 二 阶 因子 模型 


hs 
EE 


(b) 多 个 单 维 模型 


Holzinger 和 Swineford (1937) 提 出 的 双 因 子 
模型 在 近 20 年 得 到 了 重新 认识 并 作为 一 种 多 维 
特质 模型 广泛 应 用 于 医学 、 心 理学 和 教育 学 领 


域 下 面 首先 介绍 了 全 信息 项 目 双 因子 分 析 的 概念 ， 


然后 描述 全 信息 项 目 双 因子 分 析 的 基础 模型 ， 并 
介绍 参数 估计 中 体现 的 维度 缩减 思想 ， 接 着 例 举 
全 信息 项 目 双 因子 方法 在 分 析 测验 结构 、 分 数 解 
释 和 计算 机 化 自 适 应 测验 (Computerized Adaptive 
Testing，CAT) 中 的 应 用 ， 最 后 对 全 信息 项 目 双 因 
子 分 析 的 理论 研究 和 实践 应 用 提出 一 些 思考 和 
建议 。 


(c) 相关 特质 多 维 模型 


i Ax, Al, Ax, Al xs AN x, 


(e) 双 因 子 模型 


图 1 五 种 测验 EK) 结构 
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2 全 信息 项 目 双 因子 分 析 的 概念 与 特征 


双 因 子 模型 最 初 定 义 在 测验 水 平 上 (Holzinger 
& Swineford，1937)， 表 示 由 多 个 高 相关 领域 共同 
测量 一 个 一 般 特质 的 因素 结构 模型 并 用 于 分 析 具 
连续 分 布 的 测验 分 数 。 如 今 ， 双 因子 模型 主要 
应 用 到 项 目 水 平 , 并 通常 用 图 1(e) 所 示 的 路 径 图 
来 表示 其 测量 结构 。 具 体 而 言 ， 双 因子 模型 要 求 
个 观察 变量 测量 一 般 因 子 和 一 个 组 因子 ， 多 个 
察 变 量 共 同 测量 一 个 组 因子 。 换 言 之 ， 每 个 变 
只 在 一 般 因 子 和 一 个 组 因子 的 负载 不 等 于 0, 
1(e) 中 因子 负载 矩阵 A, 表示 为 ， 

Au Au ^u Aw As. Aw] 
Ay=|41 42 43 0 0 0|. 
0 0 0 Ay As ^| 

Ay (i =1…;6) 表示 一 般 因子 在 第 j 个 项 目的 负载 ; 
Aj TAGO 分 别 表示 第 一 个 和 第 二 个 组 
因子 在 第 j 个 项 目 上 的 负载 ; T 表示 矩阵 转 置 。 

全 信息 项 目 双 因子 分 析 是 以 双 因 子 模型 为 基 
础 ， 应 用 项 目 反 应 理论 分 析 作 答 反 应 ， 获 得 有 关 
项 目 、 测 验 和 被 试 特征 的 数据 分 析 方 法 。 它 具有 
如 下 特征 ,第 一 ,全 信息 项 目 双 因 子 分 析 中 双 因 
子 模型 定义 在 项 目 水 平 上 。 第 二 ,全 信息 项 目 双 
因子 分 析 运 用 双 因 子 项 目 反 应 理论 模型 分 析 被 试 
在 项 目 上 的 原始 作答 数据 。 而 传统 线性 双 因 子 分 
析 方 法 则 对 项 目 反 应 数据 (或 子 量 表 总 分 ) 的 相关 
或 协 方差 矩阵 进行 分 析 。 基 于 原始 数据 来 源 于 项 
目 水 平 ， 没 有 经 过 统计 处 理 包 含 了 被 试 的 全 部 信 
息 ， 因 而 称 其 为 “全 信息 项 目 双 因子 分 析 ”。 全 信息 
项 目 双 因 子 分 析 中 为 保证 模型 识别 问题 并 且 可 以 
直接 使 用 “维度 缩减 ”(dimension reduction) 方 法 ， 
通常 假设 一 般 因子 与 组 因子 相互 独立 , 组 因子 之 
间 相 互 独立 。“ 维 度 缩减 ”方法 是 全 信息 项 目 双 因 
子 分 析 的 重要 特征 。 因 为 无 论 测验 考察 多 少 个 能 
力 维 度 ， 它 都 使 双 因 子 项 目 反应 模型 中 项 目 参数 
边际 似 然 函数 的 积分 化 简 为 多 个 二 维 迭 代 积 分 。 
事实 上 ， 若 仅 针 对 模型 识别 问题 ， 双 因子 模型 假 
设 可 以 放松 为 在 一 般 因 子 条 件 下 特定 领域 因子 之 
间 满 足 条 件 独 立 性 (Rijmen, 2009)。 


3 全 信息 项 目 双 因 子 分 析 的 基础 模型 
和 参数 估计 


全 信息 项 目 双 因子 分 析 的 模型 基础 是 双 因子 


EE ED iE HI 


项 目 反 应 理论 模型 。 根 据 双 因子 模型 对 每 个 项 
只 测量 一 般 因 子 和 一 个 组 因子 的 假设 对 多 维 项 
反应 理论 (multidimensional item response theor 
MIRT) 模 型 进行 改写 可 以 获得 双 因 子 项 目 反应 3 
论 模 型 。 目 前 ， 较 为 熟知 的 双 因子 项 目 反 应 模型 
包括 适用 于 二 级 评分 项 目的 正 态 肩 形 模 型 和 
logistic 模型 、 适 用 于 多 级 评分 项 目的 等 级 反应 模 
型 、 分 部 评分 模型 和 称 名 反应 模型 。 
3.1 双 因 子 项 目 反 应 理论 模型 
3.1.1 二 级 评分 双 因 子 项 目 反应 模型 

Gibbons 和 Hedeker (1992) 首 次 将 双 因 子 因素 
结构 引入 IRT, 提出 双 因子 正 态 肩 形 模型 。Gibbons 
等 人 (2007) 进一步 将 双 因 子 正 态 肩 形 模型 推广 
到 双 因 子 等 级 反应 模型 。 他 们 利用 边际 极 大 似 然 
估计 方法 推导 项 目 参 数 估计 值 时 发 现 ， 双 因子 模 
型 假设 能 力 相 互 独立 , 极 大 地 简化 了 似 然 方 程 的 
计算 。 但 是 他 们 的 推导 依赖 于 双 变 量 正 态 积分 
从 而 将 测量 模型 限制 为 正 态 肩 形 模 型 。Rijmen 
(2009) 运用 图 理论 证 明 双 因子 模型 假设 在 更 一 
At IRT 模型 下 同样 能 简化 边际 似 然 函 数 的 计算 。 
Cai, Yang fll Hansen (2011) 则 进一步 描述 了 双 因 子 
logistic 模型 、 多 级 评分 项 目 双 因 子 模 型 以 及 参数 
估计 方 法 。 其 中 ， 双 因子 三 参数 logistic 模型 中 被 
试 1 正确 做 答 项 目 j 的 概率 表示 为 : 

Plu; =1|0,;,0.,) =Cj+ 


Ss 


Hee 


1-cj 


. 1 
1+ exp[-(d; 十 A jo; 十 a; )] (1) 


XE, aj 和 ay 分 别 表示 项 目 j 在 一 般 因 子 和 组 
因子 上 的 斜率 参数 ,代表 了 项 目 反 应 与 因子 之 间 
联系 的 紧密 程度 , 或 者 说 项 目 在 这 个 潜 变 量 上 的 
区 分 度 。cj 表示 下 渐 近 概率 ， 多 项 选择 项 目 中 通常 
解释 为 猜测 概率 ,心理 测量 的 项 目 还 反映 了 项 目 
VI AERU BERE MEHEREBE. d, = (aojbj + jj) 表示 
项 目 截 距 , 它 与 项 目的 难度 或 位 置 参数 bj; 人 负 相 关 。 
3.1.2 ”多 级 评分 双 因 子 项 目 反应 模型 

对 多 级 评分 项 目 而 言 , > K 表示 项 目的 反应 
类 别 数 ，ui(u; =0,1,2,--,K 21) 表示 项 目 反应 ， 
d,(k20,L2,-.,K -I) X on 25 3] RE, Du] Æ 
Samejima (1969) 提 出 的 等 级 反应 模型 基础 上 结合 
双 因 子 模 型 假设 , 可 得 双 因 子 等 级 反应 模型 。 它 
首先 计算 作答 反应 大 于 等 于 类 别 k (k=0,1,2,…， 
K-1) 的 概率 ， 即 : 
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P(uy = k|0,0;) = 
1 
1+ exp[-(d, + a; 0; + 4,9,))] 
特别 地 P(u = 0) =LPCw = K) 20. 于是, 5B k^ 
类 别 上 的 作答 概率 等 于 相 邻 两 个 类 别 累 积 作答 概 
率 的 差 ， 即 

Plu, =k | Ois Osi) = Plu; Zk|65,0:)— 

Plu, > k +1|;,0,)- (3) 
等 级 反应 模型 要 求 项 目的 截 距 参 数 dy dye, 
dk 严格 递增 ， 截 距 与 反应 类 别 的 难度 (位 置 ) 参 
数 负 相 关 。 

等 级 反应 模型 从 累积 概率 出 发 计算 类 别 反 应 
概率 属于 两 步 模型 ， 分 部 评分 模型 和 称 名 反应 模 
型 直接 计算 类 别 作答 概率 属于 divide-by-total 模 
型 。 其 中 , 分 部 评分 模型 有 多 种 等 价 表示 方式 , 在 
双 因 子 模型 假设 下 对 Muraki (1992) 中 单 维 分 部 评 
分 模型 进行 扩展 ,得 到 如 下 双 因 子 分 部 评分 模型 . 

P(uj -k|65,0;)7 
exp[T (ap ;Oi a0.) + dy] 


(2) 


oj Osi 
S expl (a4 t ag0,) + di] 
t=0 
FOB, TRNAS CAPES PAL, 解释 为 评分 者 分 
配给 反应 类 别 t 的 分 数 , 通常 取 值 为 t。 注 意 到 ， 如 
AA BEA d, 加 上 常数 m, 类 别 反 应 概率 将 保持 不 
变 ， 因 而 不 能 直接 估计 类 别 截 距 。 为 解决 参数 估 
计 问 题 ， 通常 限制 某 个 类 别 截 距 (如 du ) 等 于 0。 
分 部 评分 模型 中 通过 事先 规定 有 序 的 评分 函 
数 的 值 ， 从 而 使 K 个 反应 类 别 有 一 定 的 优 劣 次 
序 。 实 际 上 ， 某 些 项 目的 反应 与 特质 类 型 有 关 ， 项 
目 反 应 并 不 具备 严格 次 序 。 这 时 ， 称 名 反应 模型 
就 非常 适合 了 。 称 名 反应 模型 同 (4) 式 ， 其 评分 函 
数 的 值 通过 估计 而 得 ,描述 了 能 力 线性 组 合 条 件 
下 反应 类 别 间 的 次 序 。Thissen, Reeve, Bjorner 和 
Chang (2007) 曾 将 该 模型 用 于 探索 病人 自我 报告 
数据 中 反应 类 别 的 等 级 次 序 。 总 体 上 ， 称 名 反应 
模型 是 最 灵活 的 IRT 参数 模型 之 一 ， 它 能 很 好 地 
代表 项 目 反应 过 程 。 同 分 部 评分 模型 一 样 ， 估 计 
称 名 反应 模型 的 类 别 截 距 参 数 时 通常 假设 第 一 个 
类 别 截 距 为 0。 
32 ”参数 估计 
双 因 子 项 目 反 应 理论 模型 作为 验证 性 项 目 因 
素 分 析 模 型 ， 可 运用 Mplus, NOHARM IRTPRO, 


(4) 


FlexMIRT 等 软件 估计 模型 参数 ， 也 可 以 根据 马尔 
可 夫 链 蒙特 卡 洛 方法 或 最 大 边际 似 然 估计 方法 的 
思想 编辑 程序 来 估计 模型 参数 。 特 别 地 ，Gibbons 
和 Hedeker (1992) 在 运用 最 大 边际 似 然 估 计 方 法 
估计 项 目 参 数 时 提出 的 “维度 缩减 ”方法 是 全 信息 
项 目 双 因子 分 析 的 重要 特征 。 下 面 以 最 大 边际 似 
然 估计 为 例 介 绍 “ 维 度 缩减 ”思想 。 

该 方法 首先 将 能 力 视 为 无 关 参 数 将 其 从 似 然 
函数 中 积分 出 来 ， 得 到 项 目 参数 的 边际 似 然 函 数 ， 
然后 在 项 目 参 数 范 围 内 对 边际 似 然 函数 求 最 优 ， 
从 而 获得 项 目 参 数 估计 值 。 以 图 1(e) 中 所 示 的 双 
因子 模型 为 例 , SIE 1、2、3 考察 一 般 因 子 和 第 
一 个 组 因子 , SIA 4, 5, 6 考察 一 般 因 子 和 第 二 个 
组 因子 。 因 为 双 因子 模型 下 能 力 相 互 独立 ， 其 联 
合 概率 分 布 为 f(6,0,6) = f(): F(A): f(6)« F 
是 , 基于 项 目 参 数 集合 6 、 项 目 作 答 概 率 和 能 
联合 分 布 可 得 反应 y 的 边际 分 布 ， 即 : 

fo s [7 [Pola 
f(0,,0,,0,)d8,d0,0,. (5) 
由 于 项 目 反应 满足 条 件 独立 性 ， 于 是 

P(y 05,0,,0,, B) -TI Po | 05,6,,0,, P) = 

P(yi, yo. Y3 | 9,9; B)  PCya. ys. yo | 95, €». D). 
因为 组 因子 相 独 立 ， 因 而 可 将 两 个 组 因子 维度 先 独 
立地 在 联合 分 布 中 积分 , 然后 对 一 般 因子 积分 ， 即 
POIA [7| [7 POYA FOA x 


一 oo 


(6) 


[7 POs ysl 8.0208) F (0,40 Feda. O 


从 而 化 简 为 二 维 迭 代 积 分 。 特 别 地 ， 若 每 个 维度 
国定 20 个 积分 节点 ， 这 里 只 需要 估计 800 个 函数 
的 值 ， 而 直接 积分 则 需要 估计 8000 个 函数 的 值 。 
利用 标准 数值 技术 ,可 以 在 B 范围 中 找到 最 优 解 
获得 最 大 边际 似 然 估计 值 p 。 

由 此 可 见 , 维度 缩减 思想 就 是 对 项 目 参 数 的 
边际 似 然 函数 在 双 因 子 模 型 假设 下 进行 适当 重组 ， 
进而 化 简 积 分 方程 (5)。 一 般 地 , 车 有 Q 个 特殊 组 
Alt, 每 维度 有 OP 个 积分 节点 ， 则 维度 缩减 方法 
只 需要 计算 QP? 个 函数 值 ， 而 直接 积分 需要 计算 
Po! 个 函数 值 。 由 此 可 见 ， 维 度 缩 减 方法 大 大 简 
化 了 积分 计算 的 复杂 度 。 
3.3” 双 因子 项 目 反应 理论 模型 简 评 

双 因 子 项 目 反应 模型 是 多 维 项 目 反 应 模型 在 
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双 因 子 模型 假设 下 的 特殊 形式 ， 具 有 多 维 项 目 反 


表 结构 的 方法 ， 在 探索 测验 结构 时 ， 研 究 者 仍 大 


应 模型 的 一 般 特征 。 例 如 ， 双 因子 等 级 反应 模型 
中 类 别 反 应 概率 是 能 力 的 增 函 数 ， 双 因子 分 部 评 
分 模型 和 称 名 反应 模型 则 由 类 别 评分 函数 的 值 而 
定 。 者 类 别 评分 函数 的 值 递 增 ， 则 类 别 反应 概率 
是 能 力 的 增 函 数 。 反 之 能 力 高 的 被 试 在 低 得 分 类 
别 上 的 反应 概率 可 能 更 高 ， 在 高 得 分 反应 类 别 的 
反应 概率 反而 更 小 。 又 如 ,分 部 评分 模型 通过 事 
先 给 定 评分 函数 的 值 ， 成 为 称 名 反应 模型 的 特 
例 。 特 别 地 ,分 部 评分 模型 与 等 级 反应 模型 对 项 
目 反 应 过 程 的 假设 不 同 , 但 二 者 的 项 目 特征 曲线 
没有 明显 差异 , 加 之 分 部 评分 模型 作为 divide- 
by-total 模型 其 计算 更 简单 ， 因 而 它 常常 代替 等 级 
反应 模型 分 析 实 际 数 据 。 

上 述 双 因子 项 目 反 应 模型 能 够 分 析 二 级 评 
分 、 有 序 评分 和 类 别 反 应 模式 的 项 目 ,特别 是 等 
级 反应 、 分 部 评分 和 称 名 反应 模型 的 提出 显著 提 
高 了 双 因 子 模型 的 应 用 范围 。 统 计 上 讲 ， 双 因子 
模型 的 广泛 应 用 应 归功 于 维度 缩减 思想 在 参数 估 
计 中 的 应 用 。 特 别 地 ， 双 因子 模型 中 能 力 独 立 的 
假设 条 件 下 对 能 力 进 行 积分 的 计算 都 可 以 将 Q 个 
组 因子 能 力 维度 先 独 立地 求 积 分 , 然后 对 一 般 因 
子 维度 积分 ， 从 而 将 Q+1 维 积分 简化 为 Q 个 二 维 
迭代 积分 。 双 因子 项 目 反应 理论 模型 的 提出 和 计 
算 中 维度 缩减 方法 的 实现 将 极 大 地 推进 双 因 子 模 
型 的 应 用 。 此 外 , Cai, Yang 和 Hansen (2011) 以 及 
Cai (2010) 在 双 因 子 模型 的 基础 上 扩展 提出 似 双 
因子 模型 、 多 组 双 因子 分 析 和 两 层 模型 。 其 中 ， 似 
双 因 子 模型 允许 部 分 项 目 只 在 一 般 因 子 上 有 非 零 
负载 ; 多 组 项 目 双 因子 分 析 不 仅 能 估计 各 组 被 试 
潜 特 质 的 均值 和 方差 还 能 判断 项 目 在 不 同 组 之 
间 是 否 存在 项 目 功能 差异 等 问题 ; 两 层 模型 则 是 
FER T AATRE, AGE IRT 模型 和 题 组 反应 模 
型 在 内 的 更 一 般 的 项 目 反 应 模型 。 


4 全 信息 项 目 双 因 子 分 析 的 应 用 


大 量 研究 表明 双 因 子 模型 符合 认 知 能 力 、 心 
理 特 质 、 精 神 病 理 等 多 类 测验 的 结构 特征 。 目 前 ， 
全 信息 项 目 双 因子 分 析 已 广泛 应 用 于 探索 和 验证 
测验 或 量 表 的 维度 结构 、 检 验 一 般 因子 与 组 因子 
对 项 目的 贡献 .评估 被 试 的 能 力 水 平 以 及 CAT 中 。 
4.1 在 分 析 测 验 结构 中 的 应 用 
蜂 然 项 目 反 应 理论 是 一 个 广 受 欢迎 的 分 析 量 


量 采 用 传统 线性 因素 分 析 方 法 。 例 如 ，Watkins 和 
Beaujean (2014), Dombrowski, Canivez, Watkins 和 
Beaujean (2015) 分 别 使 用 验证 性 和 探索 性 双 因 子 
模型 检测 韦 氏 智力 量 表 的 因素 结构 ,研究 表明 一 
般 因 子 解释 了 大 部 分 共有 的 子 测验 方差 . 组 因子 
解释 的 方差 比例 可 以 忽略 不 计 ， 双 因子 结构 比 
Wechsler (2012, 2014) 提 出 的 高 阶 智力 结构 更 符合 
数据 事实 。 又 如 , Colwell, Gordon, Fujimoto, Kaestner 
和 Korenman (2013) 以 及 Hindman, Pendergast 和 
Gooze (2016) 指 出 照顾 者 交互 量 表 (Caregiver 
Interaction Scale，CIS) 测 量 了 一 个 一 般 因 子 和 两 
个 方法 因子 。 另 外 ,传统 双 因子 因素 分 析 还 用 于 
分 析 自 我 领导 结构 (Furthner, Rauthmann, & Schse, 
2015) 、 研 究 测量 活力 及 相关 概念 题库 的 结构 
(Deng, Guyer, & Ware, 2015)、 分 析 学 校 适 应 不 良 
行为 (Wiesner & Schanding, 2013)、 教 育成 就 动机 
(Cham, Hughes, West, & Im, 2015) 以 及 家 庭 作业 
的 功能 (Power, et al., 2015)。 这 些 研究 都 表明 双 因 
子 模型 符合 许多 心理 学 、 病 理学 和 教育 学 测验 特 
征 ， 具 有 广泛 的 应 用 前 景 。 

尽管 传统 线性 因素 分 析 方 法 能 够 快速 处 理 数 
据 , 但 全 信息 项 目 分 析 方 法 克服 了 传统 线性 因素 
分 析 中 高 估 维 度 、 低 佑 负荷 的 缺陷 ， 并 能 在 因素 
分 析 中 考虑 猜测 参数 等 优势 ( 命 宗 火 , 2005)。 特 别 
地 ,全 信息 双 因 子 分 析 运 用 “维度 缩减 "方法 极 大 
地 降低 了 计算 复杂 度 显 著 减 少 计算 时 间 。 因 而 ， 
全 信息 项 目 双 因子 分 析 已 越 来 越 多 地 被 用 到 教育 
和 心理 测验 维度 研究 。 例 如 ,消费 者 保健 计划 评 
估 调 查 (Consumer Assessment of Healthcare Providers 
and Systems，CAHPS) 数 据 的 分 析 (Reise，et al., 
2007)、 精 神 病 诊 断 筛 选 测验 (psychiatric diagnostic 
screening questionnaire，PDSQ) 因 素 结构 的 分 析 
(Gibbons, Rush, & Immekus, 2009) barratt 冲动 量 
表 结 构 的 分 析 (Steinberg, Sharp, Stanford, & Tharp, 
2013) 以 及 State Metacognitive Inventory 的 维度 评 
估 (Immekus & Imbrie 2008)。 其 中 , Reise 等 (2007) 
发 现 ， 尽 管 单 维 IRT 模型 、 相 关 特 质 多 维 IRT 模 
型 和 双 因 子 模型 对 CAHPS 提供 了 相似 拟 合 度 ， 
但 双 因 子 模型 分 析 的 结果 表明 项 目 反 应 违反 了 局 
部 独立 性 假设 , 并 且 当 去 掉 一 般 因 子 的 方差 解释 
量 时 ，CAHPS 项 目 不 再 充分 测量 每 个 子 量 表 特 
质 。 这 种 情况 下 , 单 维 IRT 的 分 析 结 果 将 存在 偏 
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22, 即 可 能 扭曲 或 看 曲 被 试 的 评分 ,而 多 维 分 析 
中 的 两 个 维度 实质 上 共同 反映 了 一 个 更 一 般 的 能 
力 因 子 。 因 此 ， 他 们 指出 双 因子 模型 允许 研究 者 
考察 单 维 模型 在 拟 合 多 侧面 数据 时 的 失真 情况 和 
考证 多 维 分 析 中 各 子 量 表 的 有 用 性 。 上 述 研究 都 
表明 双 因 子 模型 能 帮助 港 清和 解释 给 定 测验 、 问 
卷 或 量 表 的 结构 ,很 多 情况 下 比 其 它 竞 争 模 型 (如 
单 维 、 高 阶 和 相关 特质 模型 ) 能 更 准确 地 反映 量 表 
维度 。 
4.2 ”在 分 数 解 释 中 的 应 用 

双 因 子 模型 中 组 因子 往往 是 研究 者 不 感 兴 
的 无 关 因子 ， 而 双 因 子 模型 能 控制 一 些 难 以 分 离 
的 干扰 因子 的 影响 更 准确 地 解释 一 般 特质 。 例 如 
Rijmen (2010) 在 分 析 国 际 英语 评估 数据 时 将 项 目 
组 领域 的 相关 作为 特殊 因子 控制 后 分 析 整 体 英 语 
能 力 水平 。 事 实 上 ， 大 部 分 教育 测验 项 目 都 是 围 
绕 一 定 的 生活 背景 ， 而 并 没有 呈现 出 有 意义 的 认 
知 能 力 ， 如 果 控 制 这 些 无 关 因素 将 会 得 到 更 有 意 
义 的 特质 分 数 。 反 过 来 , 研究 者 也 可 能 对 控制 一 
般 因 子 之 后 特殊 因子 的 分 数 感 兴趣 。 例 如 , 在 一 
项 幼儿 园 评估 中 ,Betts，Pickart 和 Heistad (2011) 
就 在 控制 一 般 因 子 之 后 考察 了 文学 和 数字 两 个 组 
因子 是 否 能 够 预测 今后 的 阅读 和 数学 成 就 。 特 别 
db, DeMars (2013) 建议 当 控 制 一 般 因 子 后 只 有 存 
在 足够 的 信和 度 去 解释 子 量 表 分 数 时 使 用 子 量 表 分 
数 才 有 意义 ， 否 则 不 建议 使 用 子 量 表 分 数 。 
43 在 CAT 中 的 应 用 

如 前 所 述 ， 全 信息 项 目 双 因子 分 析 已 广泛 应 
用 于 分 析 心 理 量 表 、 病 人 自我 报告 、 教 育 调查 问 
卷 以 及 教育 评估 测验 获得 的 数据 , 加 之 CAT 技术 
的 成 熟 及 其 实践 应 用 ， 探 索 双 因子 模型 下 CAT 的 
理论 、 技 术 和 方法 开拓 了 全 信息 项 目 项 目 双 因子 
分 析 应 用 的 新 领域 。 目 前 ， 有 关 双 因子 模型 CAT 
的 研究 很 少 ， 主 要 包括 双 因 子 模型 CAT 的 实现 和 
选 题 策略 的 研究 。 

首先 ，Weiss 和 Gibbons (2007) 以 双 因 子 模型 


项 目的 数据 集 证 明 在 保证 CAT 能 力 估 计 值 与 全 量 
表 能 力 估计 值 的 相关 大 于 0.9 时 ， 双 因子 CAT 中 
一 般 因子 的 平均 测验 长 度 缩短 了 95%， 各 个 内 容 
领域 的 测验 长 度 减 少 了 68% 到 90%, 总 体 上 讲 , 与 
纸 笔 测验 相 比 ， 双 因子 CAT. 的 平均 测验 长 度 减少 
了 80%， 实 际 节 省 约 82% 的 测验 时 间 , 其 次 , Zheng 
Chang 和 Chang (2013) 采 用 Weiss 和 Gibbons (2007) 
的 双 因 子 CAT 方法 ,考察 了 内 容 约 束 条 件 对 测量 
精度 和 项 目 使 用 率 的 影响 。 

上 述 研 究 都 是 在 单 维 情 况 下 开展 双 因 子 CAT, 
通过 多 阶段 CAT 实现 多 维 能 力 评 佑 ， 并 没有 实现 
在 CAT 中 的 直接 应 用 双 因 子 项 目 反 应 模型 。 鉴 于 
此 , Seo (2011) 将 传统 多 维 CAT 项 目 选 择 方法 和 能 
力 估计 方法 应 用 到 双 因 子 IRT 模型 ， 实现 多 维 双 
因子 模型 CAT. Seo 和 Weiss (2015) 进 一 步 在 低 双 
因子 结构 、 高 双 因 子 结构 和 似 双 因子 结构 下 比较 
T DD- 优 化、D, 优化 ,A 优化 和 EE 优化 四 种 项 目 选 
择 方 法 。Seo (2011) (Seo & Weiss, 2015) 的 研究 呈 
现 了 双 因 子 模型 下 项 目 选择 和 能 力 估计 的 特点 ， 
为 双 因 子 模型 CAT 的 相关 研究 打下 基础 。 

4.4 全 信息 项 目 双 因子 分 析 应 用 简 评 

首先 ， 全 信息 项 目 双 因子 分 析 中 双 因 子 模 型 
提供 了 一 个 极 好 的 测量 结构 框架 ,在 探索 和 验证 
测验 结构 时 具有 一 些 独 特性 。 例 如 ， 双 因子 模型 
通过 分 离 一 般 因 子 和 组 因子 对 项 目 集合 的 贡献 
更 容易 解释 因子 含义 、 检 测 项 目 是 否 违背 局 部 独 
立 性 假设 、 发 展 子 量 表 并 指明 多 维 量 表 中 分 量 表 
的 信和 度 和 有 用 性 。 当 多 个 采用 了 相同 反应 类 别 、 
措辞 、 表 述 特征 的 项 目 集合 带 来 的 方法 效应 解释 
了 控制 主要 因素 之 后 独特 的 方差 时 ， 双 因子 模型 
能 检测 非 研究 目的 的 方法 性 方差 .并 指出 这 些 项 
目 如 何 捆绑 在 一 起 ， 从 而 更 好 地 澄清 工具 的 维度 
结构 。 特 别 地 ， 双 因子 模型 通过 识别 方法 效应 不 
仅 提高 了 模型 拟 合 统计 ， 还 能 帮助 识别 有 实质 意 
义 的 维度 ， 而 这 些 维度 可 能 在 传统 探索 性 因素 分 
析 中 受到 方法 效应 的 影响 而 被 掩盖 。 值 得 注意 的 


题库 为 基础 将 CAT 分 为 多 个 阶段 , 每 个 阶段 测量 
一 种 能 力 实现 了 双 因 子 测量 结构 在 单 维 CAT 中 的 
应 用 。 具 体 来 讲 , 第 一 阶段 在 所 有 项 目 中 选择 题 
目 ， 获 得 一 般 能 力 和 领域 能 力 估 计 值 ， 以 后 各 阶 
段 分 别 以 第 一 阶段 中 领域 能 力 估 计 值 作为 能 力 初 
值 在 各 个 子 量 表 领 域 选择 项 目 ， 获 得 各 个 子 组 能 
力 的 估计 值 。 他 们 通过 多 个 来 自 615 个 人 格 测量 


是 , 虽然 双 因 子 模型 假设 测验 考察 一 个 主要 维度 
但 当 测 验 显示 出 很 强 的 单 因 子 结构 时 不 适合 使 用 
双 因 子 模型 。 同 样 ， 当 项 目 在 多 个 组 因子 维度 有 
负载 时 也 不 适合 使 用 双 因 子 模型 。 只 有 当 研 究 者 
有 很 强 的 理论 证 据 支 持 所 考察 领域 的 双 因 子 结构 
或 者 有 证 据 表明 双 因 子 结构 比 其 他 模型 更 适合 的 
时 候 采 用 双 因 子 模型 才 更 有 意义 。 
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其 次 , 全 信息 项 目 双 因子 分 析 中 双 因 子 项 目 
反应 模型 关注 被 试 在 不 相关 的 一 般 特质 和 多 个 领 
域 因 子 上 的 表现 , 这 与 多 维 项 目 反 应 理论 模型 通 
常 在 多 个 相关 领域 上 对 个 体 进行 评定 不 同 。 因 而 ， 
全 信息 项 目 双 因 子 分 析 依 赖 能 够 在 一 定 程度 上 准 


估计 、 模 型 特征 、 量 表 连 接 、 项 目 功 能 差异 、 模 
型 和 项 目 拟 合 以 及 CAT 应 用 方面 都 还 有 待 开展 深 
入 研究 。 

首先 ， 针 对 双 因 子 项 目 反 应 理论 模型 参数 佑 
计 问 题 ， 还 缺乏 系统 研究 考察 参数 估计 中 选用 不 


确 测量 那些 独立 于 一 般 因 子 的 多 个 特定 领域 因子 
的 测验 。 这 一 点 上 ， 双 因子 IRT 模型 与 其 它 多 维 
IRT 模型 相 比 , 一 方面 能 更 清楚 解释 特质 的 含义 ， 
另 一 方面 却 不 能 提高 测验 效率 。 

再 次 , 全 信息 项 目 双 因子 分 析 在 CAT 中 的 应 
用 也 具有 一 些 特殊 性 。 多维 CAT 中 测验 考察 的 维 
度 越 多 ,能 力 估计 和 项 目 选择 的 计算 越 复 杂 。 当 
多 维 CAT 中 运用 二 阶 因 子 模型 时 ， 其 参数 估计 的 
效率 和 复杂 性 同样 会 受到 一 阶 潜 特 质 因 子 数量 的 
限制 。 而 双 因 子 IRT 模型 中 假设 一 般 因 子 与 组 因 
子 正 交 、 组 因子 之 间 正 交 能 极 大 地 简化 有 关 能 力 
的 积分 运算 , 例如 简化 CAT 中 期 望 后 验 能 力 估计 
和 项 目 信 息 量 (Kullback-Leibler 信息 量 、 互 信息 、 
连续 炉 ) 的 计算 。 于 是 ， 当 多 维 CAT 中 运用 双 因 子 
IRT 模型 时 ， 其 受 因子 个 数 的 影响 不 大 。 另 外 ， 双 
因子 IRT 模型 中 一 般 因 子 和 组 因子 都 是 一 阶 因 子 ， 
因而 双 因 子 IRT 模 型 下 CAT 的 计算 不 比 单 维 CAT 
更 复杂 多 少 , 与 此 同时 双 因 子 IRT 模型 下 CAT 与 
其 它 多 维 CAT 相 比 并 不 会 提高 CAT 的 测验 效率 , 
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全 信息 项 目 双 因子 分 析 中 双 因 子 模型 要 求 每 
个 项 目测 量 一 般 因 子 和 一 个 组 因子 ,并 假设 能 力 
相互 正 交 , 是 一 类 特殊 的 多 维 模型 。 首先 ， 双 因子 
模型 中 不 相关 因素 结构 能 解释 独特 的 因素 方差 变 
异 量 ， 而 相关 特质 多 维 模型 中 只 能 获得 共享 的 因 
素 方差 变异 量 。 其 次 ， 双 因子 模型 将 题目 变异 分 
解 为 一 般 因子 变异 、 领 域 组 因子 变异 和 误差 变异 ， 
测验 的 同 质 性 信和 度 和 内 部 一 致 性 信 度 的 计算 也 
ARREA, IEEE, 方 杰 , 2014)。 再 次 ， 双 
因子 模型 通过 指明 一 般 因子 与 组 因子 的 地 位 克服 
了 二 阶 因子 模型 中 对 高 阶 因子 解释 的 不 确定 性 和 
模糊 性 , 通过 考察 一 般 因 子 和 组 因子 对 项 目 变异 
的 解释 量 还 能 检验 模型 的 单 维 性 假设 。 全 信息 项 
目 双 因子 分 析 结 合 了 双 因 子 模型 和 项 目 反应 理论 
模型 ， 具 备 二 者 的 优势 和 特征 。 目 前 ,全 信息 项 目 
双 因 子 分 析 在 验证 测验 结构 方面 已 得 到 广泛 应 用 ， 
但 对 双 因 子 项 目 反 应 模型 的 相关 研究 ， 如 : 参数 


i 
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同 初始 值 或 不 同 先 验 分 布 的 效应 ; 缺乏 研究 考察 
违反 特定 假设 时 参数 估计 的 结果 ; 也 需要 进一步 
探讨 不 同 估计 方法 的 特点 ， 系统 比较 它们 在 各 种 
测验 条 件 下 的 估计 结果 。 
其 次 , 分 析 双 因子 项 目 反 应 理论 模型 下 项 目 
特征 曲线 和 条 件 项 目 类 别 特征 曲线 , 不仅 可 以 解 
释 能 力 如 何 影响 项 目 作 答 反 应 , 还 能 比较 不 同 被 
试 群体 中 能 力 对 项 目 反 应 的 影响 是 否 相 同 。 
Toland, Sulis, Giambona, Porcu 和 Campbell (2017) 
描述 了 双 因 子 等 级 反应 模型 中 条 件 项 目 类 别 特征 
曲线 和 信息 函数 的 定义 、 特 征 及 其 解释 。 由 于 项 
目 信息 函数 在 不 同 模型 下 的 表达 式 不 同 ， 因 而 推 
导 双 因子 项 目 反应 理论 模型 下 信息 函数 的 计算 对 
分 析 项 目 与 测验 特征 ， 开展 CAT 都 极其 重要 。 另 
外 , 分 析 测 验 信息 与 测验 中 不 同 项 目 类 型 的 比例 
之 间 的 关系 将 对 测验 组 卷 具 有 重要 指导 意义 。 
再 次 ， 双 因子 IRT 模型 下 量 表 连 接 、 项 目 功 
能 差异 检验 也 都 具有 特殊 性 。 众 所 周知 ,测验 考 
察 维 度 越 多 ， 量 表 连 接 和 项 目 功 能 差异 的 检验 都 
越 复杂 。 如 果 研 究 者 只 对 一 般 因子 感 兴趣 ， 而 忽 
视 组 因子 维度 ,那么 标准 的 量 表 连 接 方法 在 双 因 
子 模型 下 就 显得 容易 了 。Cai 等 (2011) 曾 对 项 目 功 
能 差异 检验 的 似 然 比 检验 方法 和 Langer (2008) 描 
述 的 Wald 方法 进行 调整 后 适用 于 双 因 子 模型 。 
另外 , Fukuhara 和 Kamata (2011) 基 于 题 组 项 目 提 
出 双 因 子 多 维 项 目 反 应 理论 模型 项 目 功能 差异 检 
验 模型 ，Somerville (2012) 提出 全 信息 项 目 双 因 
子 分 析 中 五 步 题 组 项 目 功能 差异 检测 方法 。 特 别 
地 ， 双 因子 模型 将 一 般 因子 和 组 因子 分 离开 来 ， 
将 更 容易 解释 项 目 功能 差异 的 来 源 。 此 外 , IRT FF 
景 下 已 有 大 量 模型 拟 合 指标 和 项 目 拟 合 指标 ， 如 
Li 和 Rupp (2011) 讨 论 了 全 信息 项 目 双 因子 模型 中 
5 一 多 在 检验 个 人 拟 合 中 的 表现 ,在 双 因 子 测验 结 
构 下 检验 这 些 指 标的 性 能 、 提 出 新 的 模型 和 项 目 
拟 合 指标 都 显得 格外 重要 。 
最 后 ， 双 因子 IRT 模型 下 CAT 作为 全 信息 项 
目 双 因子 分 析 的 一 个 重要 的 应 用 领域 还 有 很 多 实 
际 问题 值得 进一步 研究 。 例 如 ,考察 双 因 子 IRT 
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模型 下 Kullback-Leibler fri Ave ITIL. ARM 
和 互信 息 等 选 题 方法 在 一 般 能 力 维度 和 领域 能 力 
维度 的 选 题 表 现 ; 又 如 ， 考察 在 是 否 具有 无 关 能 
力 维度 ， 是 否 关注 线性 能 力 组 合 条 件 下 比较 选 题 
方法 的 表现 ; 再 如 ， 探 索 双 因子 IRT 模型 下 CAT 
中 项 目 曝光 控制 和 内 容 约 束 、 探 索 双 因子 IRT 模 
型 下 混合 测验 CAT 中 多 级 评分 项 目的 比例 和 呈现 
方式 如 何 影响 测验 表现 、 题 库 增补 等 都 是 有 意义 
的 研究 问题 。 
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Abstract: Full-information item bifactor analysis is an important statistical method in psychological and 
educational measurement, which can be seen as a rediscovery of the classical bifactor model and has seen 
wide applications in the past two decades. The item response model of full-information item bifactor 
analysis is described upon the introduction of the conception and characterization of full-information item 
bifactor analysis. Further, we introduced the dimension reduction method used in parameter estimation. 
Then, examples are provided for applications of the full-information item bifactor model in test 
measurement structure exploration or confirmation, score interpretation, and computerized adaptive testing. 
The measurement structure of full-information item bifactor analysis is accordance with most tests in the 
areas of psychology, education, and medical science. With the advantage in dimension reduction, it is 
believed that the full-information item bifactor analysis could be valuable and useful in various situations. 
At last, some future research directions and suggestions are put forward including parameter estimation, test 
linking, differential item functioning, model fit testing, and application of bifactor item response theory to 
computerized adaptive testing. 

Key words: bifactor model; full-information item bifactor analysis; bifactor item reponse theory model; 
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